Πειραματικές Προσομοιώσεις ΚΕΦΑΛΑΙΟ 4 Όλες οι προσομοιώσεις έγιναν σε περιβάλλον Matlab. Για την υλοποίηση της μεθόδου ε-svm χρησιμοποιήθηκε το λογισμικό SVM-KM που αναπτύχθηκε στο Ecole d Ingenieur(e)s Publique INSA Rouen, και συγκεκριμένα στο τμήμα ASI (Architecture des Systemes de l Information). O κώδικας του SVM-KM είναι γραμμένος αποκλειστικά σε Matlab [20]. Σε αυτό το κεφάλαιο θα συγκρίνουμε την προτεινόμενη μέθοδο FWSVR with Fuzzy Partition με την απλή μέθοδο Global SVR. Θα μελετηθούν κάποια προβλήματα προσέγγισης συναρτήσεων. Σε καθένα από τα προβλήματα αυτά, από το σύνολο των δεδομένων, θα χρησιμοποιήσουμε ένα τμήμα για τη δημιουργία του μοντέλου (training data) και ένα τμήμα για τον έλεγχο της επίδοσής του (testing data). Σα συναρτήσεις σφάλματος για να περιγράψουμε την απόδοση των μεθόδων θα χρησιμοποιήσουμε το RMSE(Root Mean Square Error) και το MAE(Mean Absolute Error) που ορίζονται ως εξής: RMSE N y ˆ 2 j y j j 1 N (4.1) N 1 MAE y ˆ j y N j (4.2) j 1 Όπου N είναι το πλήθος των δεδομένων (εκπαίδευσης ή ελέγχου), y j είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j είναι η εκτιμώμενη απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου). Σε αυτό το σημείο οφείλουμε να τονίσουμε ότι σε όλα τα παραδείγματα που ακολουθούν χρησιμοποιήθηκαν συγκεκριμένες τιμές για τις παραμέτρους του αλγορίθμου FCM. Εξαίρεση αποτελεί ο αριθμός των ομάδων C, ο οποίος παίζει καταλυτικό ρόλο στην απόδοση της προτεινόμενης μεθόδου. Συγκεκριμένα χρησιμοποιήθηκαν οι παρακάτω τιμές: Για την εκθετική σταθερά m 2 Για το μέγιστο αριθμό επαναλήψεων L 100 Για τη σταθερά τερματισμού 0.00001 33
Ο πυρήνας με τον οποίο θα δουλέψουμε θα είναι πάντα ο Gaussian RBF, και κάθε σύγκριση των μεθόδων θα γίνεται χρησιμοποιώντας τις ίδιες παραμέτρους-svr, για να είναι δίκαιη. Εκτός όμως από την απόδοση, οι δύο μέθοδοι θα συγκριθούν και ως προς το χρόνο διεκπεραίωσής τους. Στην περίπτωση του FWSVR With Fuzzy Partition, ο ολικός χρόνος υπολογισμού θα περιλαμβάνει: Α) Το διαχωρισμό των δεδομένων εκπαίδευσης σε C υποσύνολα εκπαίδευσης Β) Την κατασκευή των C Τοπικών Μοντέλων Παλινδρόμησης (LRMs). Γ) Τον υπολογισμό της εκτιμώμενης απόκρισης με τον Ασαφώς Σταθμισμένο Μηχανισμό 34
4.1 Ημιτονοειδής Συνάρτηση Σε αυτό το πρώτο παράδειγμα θα θεωρήσουμε μια απλή συνάρτηση που ορίζεται από την: 10 x cos2 0,5 y x e x x (4.3) Η συνάρτηση 4.3 θα παράγει 1502 δείγματα, από τα οποία: Τα 1001 θα χρησιμοποιήσουμε ως δεδομένα εκπαίδευσης (training data) Τα 501 θα χρησιμοποιήσουμε ως δεδομένα επαλήθευσης (testing data) Να σημειωθεί ότι ο παραπάνω διαχωρισμός γίνεται με τυχαίο τρόπο. Χρήση Global SVR Θα ξεκινήσουμε με τη μέθοδο Global SVR, θα δουλέψουμε δηλαδή με έναν ε-svr για όλο το σύνολο των δεδομένων εκπαίδευσης. Οι SVR-παράμετροι θα έχουν τιμές:,, 1.5, 1000, 0.05 Σχήμα 4.1 Εκτιμώμενη απόκριση συστήματος με μονοδιάστατη έξοδο, με χρήση Global SVR Μαύρη Γραμμή: Εκτιμώμενη Απόκριση Global SVR Μπλε σταυροί (+): Πραγματική Απόκριση του συνόλου εκπαίδευσης σύμφωνα με τη σχέση 4.3 35
Όπως φαίνεται στο σχήμα 4.1, η απόκριση του συστήματος έχει άσχημη απόδοση της τοπικής συμπεριφοράς του μοντέλου. Χρήση FWSVR With Fuzzy Partition Με τις ίδιες τιμές για τις SVR-παραμέτρους, δηλαδή:,, 1.5, 1000, 0.05 προσεγγίζουμε τη συνάρτηση 4.3 σύμφωνα με την προτεινόμενη μέθοδο. Αν ομαδοποιήσουμε τα δεδομένα σε C 3 ομάδες και θέσουμε 2.5, θα έχουμε 3 Τοπικά Μοντέλα Παλινδρόμησης (LRMs) με τις παρακάτω αποκρίσεις: Σχήμα 4.2 Απόκριση των τριών LRM Μπλε σταυροί (+): Πραγματική Απόκριση του συνόλου εκπαίδευσης σύμφωνα με τη σχέση 4.3 Κίτρινα Σημεία( ): Κέντρα των ομάδων που προκύπτουν από FCM Κάθε απόκριση LRM παρουσιάζεται γραμμή διαφορετικού χρώματος: Κόκκινο, Μαύρο, Μωβ 36
Με τις διακεκομμένες χρωματιστές γραμμές του σχήματος 4.2 αναπαριστούμε το διαχωρισμό της μονοδιάστατης εισόδου σε 3 διαφορετικά υποσύνολα εκπαίδευσης. Έτσι παρατηρούμε ότι τα σημεία που έχουν είσοδο: 0 x 1.98 ανήκουν στο υποσύνολο-1 (κόκκινο) 1.4 x 3.7 ανήκουν στο υποσύνολο-2 (μαύρο) 3.2 x 5 ανήκουν στο υποσύνολο-3 (μωβ) Αν συνθέσουμε τις αποκρίσεις των τριών LRMs με τον Ασαφώς Σταθμισμένο Μηχανισμό που παρουσιάσαμε στην ενότητα 3.4, θα έχουμε το παρακάτω αποτέλεσμα: Σχήμα 4.3 Ολική εκτιμώμενη απόκριση με τη μέθοδο FWSVR with Fuzzy Partition και C=3 Παρατηρούμε ότι παρόλο που οι SVR-παράμετροι της προτεινόμενης μεθόδου είναι ίδιες με αυτές της Global SVR, η απόδοση του μοντέλου είναι τώρα πολύ καλύτερη. Ο αλγόριθμος που υλοποιεί τον FWSVR αντιλαμβάνεται εύκολα τις μικρές τοπικές αλλαγές, ακόμα και όταν οι SVR-παράμετροι δεν είναι οι καλύτερες δυνατές. 37
Προχωρούμε στην παρούσα προσομοίωση με χρήση FWSVR αυξάνοντας τον αριθμό C των υποσυνόλων εκπαίδευσης, ενώ κρατάμε όλες τις υπόλοιπες παραμέτρους σταθερές: C 5 C 7 Σχήμα 4.4 Ολική εκτιμώμενη απόκριση FWSVR with Fuzzy Partition και C=5 Σχήμα 4.5 Ολική εκτιμώμενη απόκριση FWSVR with Fuzzy Partition και C=7 38
C 9 C 11 Σχήμα 4.6 Ολική εκτιμώμενη απόκριση FWSVR with Fuzzy Partition και C=9 Σχήμα 4.7 Ολική εκτιμώμενη απόκριση FWSVR with Fuzzy Partition και C=11 39
C 12 C 15 Σχήμα 4.8 Ολική εκτιμώμενη απόκριση FWSVR with Fuzzy Partition και C=12 Σχήμα 4.9 Ολική εκτιμώμενη απόκριση FWSVR with Fuzzy Partition και C=15 40
Στα σχήματα 4.3-4.9 παρατηρούμε ότι όσο αυξάνεται ο αριθμός των LRMs, τόσο πιο κοντά «πέφτει» η απόκριση της προτεινόμενης μεθόδου στην πραγματική. Με μια απλή ματιά στα σχήματα 4.1 και 4.9 γίνεται αντιληπτό το πόσο βελτιωμένο αποτέλεσμα μπορούμε να πετύχουμε με τη χρήση FWSVR χωρίς να αλλάξουμε τις παραμέτρους,,. Αυτό φαίνεται και από τον πίνακα 4.1, ο οποίος περιλαμβάνει τα αποτελέσματα των δύο μεθόδων που συγκρίνουμε: Το σφάλμα ελέγχου RMSE με Global SVR είναι 1.6405, ενώ με FWSVR μπορεί να μειωθεί μέχρι και στο 0.11027. Πίνακας 4.1 Αποτελέσματα της προσέγγισης της συνάρτησης 4.3 με χρήση της προτεινόμενης μεθόδου, καθώς και της μεθόδου Global SVR, με το ίδιο σύνολο SVR-Παραμέτρων {1.5, 1000, 0.2} Μέθοδος LRMs Εκπαίδευσης RMSE Ελέγχου Συνολικός Χρόνος Υπολογισμού (sec) Χρόνος Κατασκευής των LRM (sec) Global SVR - 1.6282 1.6405 20.7714-3 1.2196 1.1924 6.0113 5.4787 5 0.63682 0.69155 3.1701 2.831 Fuzzy Weighted SVR 7 0.39156 0.36717 2.0942 1.6227 9 0.36968 0.3289 1.4603 0.99865 11 0.18984 0.17889 1.5402 0.86209 12 0.1554 0.19765 1.6906 0.9387 15 0.11732 0.11027 1.57 0.71281 Όπως γίνεται αντιληπτό, ο αριθμός των LRMs παίζει σημαντικό ρόλο στη βελτίωση της απόδοσης του μοντέλου. Αυτό συμβαίνει γιατί μεγάλος αριθμός LRMs σημαίνει μεγάλη ε- ξειδίκευση σε μικρές περιοχές της εισόδου του συνόλου εκπαίδευσης. Άρα ο αλγόριθμος του FWSVR είναι πολύ ευαίσθητος σε αλλαγές στην απόκριση μεταξύ σημείων που βρίσκονται πολύ κοντά στο χώρο της εισόδου. Ο τρόπος με τον οποίο επιδρά το πλήθος των LRMs στις συναρτήσεις σφάλματος RMSE (εκπαίδευσης και ελέγχου) της προτεινόμενης μεθόδου αναπαριστάται στα σχήματα 4.10 και 4.11: 41
Σχήμα 4.10 Επίδραση του Πλήθους των LRMs (παράμετρος C) στη συνάρτηση σφάλματος εκπαίδευσης RMSE Σχήμα 4.11 Επίδραση του Πλήθους των LRMs (παράμετρος C) στη συνάρτηση σφάλματος ελέγχου RMSE 42
Επιπλέον, ενδιαφέρον παρουσιάζει η σύγκριση των δύο μεθόδων ως προς το συνολικό χρόνο υπολογισμού της εκτιμώμενης απόκρισης. Όπως διαπιστώνουμε από τα αποτελέσματα του πίνακα 4.1, με χρήση FWSVR πετυχαίνουμε δραστική μείωση του χρόνου υπολογισμού της προσέγγισης, καθώς διαιρούμε το αρχικό πρόβλημα σε πολλά μικρά υποπροβλήματα. Η κατασκευή των LRMs απαιτεί το μεγαλύτερο μέρος του συνολικού χρόνου. Συνεπώς σημαντική επίδραση έχει η παράμετρος C (-πλήθος LRMs) και στο χρόνο επίλυσης του προβλήματος. Σχήμα 4.12 Επίδραση του πλήθους των LRMs (παράμετρος C) στο συνολικό χρόνο υπολογισμού της εκτιμώμενης απόκρισης των δεδομένων που παράγονται από τη συνάρτηση 4.3 4.2 Συνάρτηση με Δύο Μεταβλητές Εισόδου Θα προσεγγίσουμε τώρα την παρακάτω συνάρτηση: 2 2 1 2 2 2 sin x1 x2 y x1, x2 5 x x (4.4) Η οποία έχει τη δυσδιάστατη είσοδο x1 x x. 2 43
Με βάση την 4.4 θα παράγουμε 42x42=1764 δείγματα, από τα οποία: Τα (32x32)=1024 θα χρησιμοποιήσουμε ως δείγματα εκπαίδευσης (training data) Τα 740 θα χρησιμοποιήσουμε ως δείγματα ελέγχου (testing data) Θα επιλέξουμε αυτή τη φορά ως SVR-παράμετρους το σετ,, 3, 15, 0.05 και θα εφαρμόσουμε τις δύο μεθόδους: Χρήση Global SVR Η απόκριση του μοντέλου φαίνεται στο παρακάτω σχήμα: Σχήμα 4.13 Παρατηρούμε ότι οι παράμετροι του SVR είναι πολύ καλά επιλεγμένοι και δίνουν μια πολύ καλή εκτίμηση της απόκρισης. 44
Χρήση FWSVR With Fuzzy Partition Θα χρησιμοποιήσουμε τώρα τη μέθοδο του FWSVR With Fuzzy Partition με τις εξής παραμέτρους: 3 C 4, 6, 8, 10 LRMs C 4 Σχήμα 4.14 Διαχωρισμός των δεδομένων σε C=4 υποσύνολα εκπαίδευσης και με η=3. Τα όρια των υποσυνόλων εκπαίδευσης είναι τα ορθογώνια παραλληλόγραμμα που σχηματίζουνε οι διακεκομμένες γραμμές (Μαύρες, Κόκκινες, Πράσινες, Μωβ) 45
Σχήμα 4.15 Απόκριση της μεθόδου FWSVR with fuzzy partition στα δεδομένα που παράγονται από την 4.4 για C=4 C 10 Σχήμα 4.16 Απόκριση της μεθόδου FWSVR with fuzzy partition στα δεδομένα που παράγονται από την 4.4 για C=10 46
Πίνακας 4.2 Αποτελέσματα της προσέγγισης της συνάρτησης 4.4 με χρήση της προτεινόμενης μεθόδου, καθώς και της μεθόδου Global SVR, με το ίδιο σύνολο SVR-Παραμέτρων {3, 15, 0.05} Μέθοδοι LRMs Εκπαίδευσης RMSE Ελέγχου Συνολικός Χρόνος Υπολογισμού (sec) Χρόνος Κατασκευής των LRM (sec) Global SVR - 0,034509 0,033044 45,430-4 0,033242 0,033438 20,707 18,944 Fuzzy Weighted SVR 6 0,03196 0,031771 17,965 16,064 8 0,032168 0,031125 15,402 13,058 10 0,030372 0,030634 13,734 10,804 Όπως γίνεται αντιληπτό από τα Σχήματα 4.15-4.16 και τον Πίνακα 4.2 γίνεται αντιληπτό ότι η προτεινόμενη μέθοδος δεν προσφέρει πολύ μεγαλύτερη ακρίβεια όταν οι SVRπαράμετροι είναι επιλεγμένες σωστά. Μειώνει όμως δραστικά το συνολικό χρόνο υπολογισμού της εκτιμώμενης απόκρισης καθώς αυξάνει η παράμετρος C. Σχήμα 4.17 Επίδραση του πλήθους των LRMs (παράμετρος C) στο συνολικό χρόνο υπολογισμού της εκτιμώμενης απόκρισης των δεδομένων που παράγονται από τη συνάρτηση 4.4 47
4.3 Μη-γραμμικό Δυναμικό σύστημα Έχουμε το παρακάτω μη γραμμικό δυναμικό σύστημα: όπου: 1, 2, 1, 1,50 y t g y t y t u t Noise t (4.5) y 0 y 1 0 2 2 1 y t 1 y t 2 y t 1 y t 2 y t 1 2.5 g y t 1, y t 2, u t 1 u t 1 4 t u t sin 50 (4.6) Ο θόρυβος ακολουθεί Γκαουσσιανή κατανομή με Signal to NoiseRatio 25dB. Η έξοδος του συστήματος εξαρτάται και από την είσοδο και από τις προηγούμενες τιμές της εξόδου. Στόχος μας είναι να προσεγγίσουμε το μη-γραμμικό τμήμα του συστήματος 1, 2, 1. Επομένως, είσοδος θα είναι οι y t 1, y t 2, u t 1 y t. g y t y t u t έξοδος είναι ιη Θα ληφθούν σύμφωνα με τις παραπάνω σχέσεις 1500 δείγματα, από τα οποία: Τα 750 θα χρησιμοποιηθούν ως δείγματα εκπαίδευσης (training data) Τα υπόλοιπα 750 θα χρησιμοποιηθούν ως δείγματα ελέχου (testing data), ενώ Όπως προηγούμενως, έτσι και τώρα θα χρησιμοποιήσουμε τις ίδιες SVR-παραμέτρους για να έχουμε μια δίκαιη σύγκριση μεταξύ των μεθόδων. Η συνάρτηση σφάλματος θα είναι η Root-Mean-Square Error (RMSE) της εξίσωσης 4.1. Οι τιμές των SVR-παραμέτρων θα είναι οι εξής:,, 30, 1000, 0.2 Τα διαγράμματα που ακολουθούν μας δίνουν την προσέγγιση της συνάρτησης 4.5 ακολουθώντας τις μεθόδους Global SVR και FWSVR with Fuzzy Partition. Ο πίνακας 4.3 καταγράφει την αποτελεσματικότητα των μεθόδων. 48
Μέθοδος Global SVR Σχήμα 4.17 Προσέγγιση του μη-γραμμικού δυναμικού συστήματος της 4.5 με Global SVR Μέθοδος FWSVR with Fuzzy Partition Με πλάτος 2.5 και: C 3 Σχήμα 4.18 Προσέγγιση του μη-γραμμικού δυναμικού συστήματος της 4.5 με FWSVR με C=3 49
C 5 Σχήμα 4.19 Προσέγγιση του μη-γραμμικού δυναμικού συστήματος της 4.5 με FWSVR με C=5 C 7 Σχήμα 4.20 Προσέγγιση του μη-γραμμικού δυναμικού συστήματος της 4.5 με FWSVR με C=7 50
C 9 Σχήμα 4.21 Προσέγγιση του μη-γραμμικού δυναμικού συστήματος της 4.5 με FWSVR με C=9 Πίνακας 4.3 Αποτελέσματα της προσέγγισης της συνάρτησης 4.5 με χρήση της προτεινόμενης μεθόδου, καθώς και της μεθόδου Global SVR, με το ίδιο σύνολο SVR-Παραμέτρων {30, 1000, 0.2} Μέθοδοι LRMs Εκπαίδευσης RMSE Ελέγχου Συνολικός Χρόνος Υπολογισμού (sec) Χρόνος Κατασκευής των LRM (sec) Global SVR 1.0674 1.06 5.787 3 0.51404 0.5496 1.6183 1.5066 5 0.48227 0.51119 0.71246 0.57398 Fuzzy Weighted SVR 7 0.38479 0.37774 0.50338 0.32218 9 0.3473 0.36697 0.55942 0.29835 11 0.32287 0.33632 0.536 0.25913 13 0.3131 0.26094 0.518 0.23075 51
Σχήμα 4.22 Επίδραση του Πλήθους των LRMs (παράμετρος C) στη συνάρτηση σφάλματος εκπαίδευσης RMSE Σχήμα 4.23 Επίδραση του Πλήθους των LRMs (παράμετρος C) στη συνάρτηση σφάλματος ελέγχου RMSE 52
Σχήμα 4.24 Επίδραση του πλήθους των LRMs (παράμετρος C) στο συνολικό χρόνο υπολογισμού της εκτιμώμενης απόκρισης των δεδομένων που παράγονται από τη συνάρτηση 4.5 Μελετώντας τα σχήματα 4.17-4.24 και τον πίνακα 4.3 επιβεβαιώνονται τα συμπεράσματα στα οποία καταλήξαμε και στις προηγούμενες προσομοιώσεις. Στο συγκεκριμένο παράδειγμα, οι SVR-παράμετροι δεν είναι οι καλύτεροι δυνατοί, και αυτό έχει σαν αποτέλεσμα η μέθοδος Global SVR να παρουσιάζει μεγάλες τιμές RMSE (Training/ Testing=1.0674/1.06) H προτεινόμενη μέθοδος, αντίθετα, μπορεί να εξάγει ακριβή αποτελέσματα ακόμα και με αυτές τις μη-βέλτιστες SVR-παραμέτρους (Training/ Testing=0.3131/0.26094 είναι οι μικρότερες τιμές σφάλματος που πετύχαμε με C=13) Το σχήμα 4.24 δείχνει πόσο μεγάλο ρόλο παίζει το πλήθος των τοπικών μοντέλων παλινδρόμησης LRM στο συνολικό χρόνο υπολογισμού. Συγκρίνοντας τις αντίστοιχες τιμές του πίνακα 4.3 παρατηρούμε ότι ο FWSVR όχι μόνο μπορεί να προσεγγίσει καλύτερα τη συνάρτηση 4.5 από ό,τι ο Global SVR, αλλά και η όλη διαδικασία της εξαγωγής των αποτελεσμάτων του FWSVR διαρκεί πολύ λιγότερο. Συγκεκριμένα, για C=13 o συνολικός χρόνος υπολογισμού του FWSVR είναι 10 φορές μικρότερος από τον αντίστοιχο του Global SVR. 53